Search CORE

9 research outputs found

Supervised classifiers to identify hate speech on English and Spanish tweets

Author: Alexeev Alexey
Almatarneh Sattam
Gamallo Pablo
Ribadas Pena Francisco José
Publication venue: COmputational LEarnig
Publication date: 08/02/2024
Field of study

Consistently with social and political concern about hatred and harassment through social media, in recent years, automatic hate-speech detection and offensive behavior in social media are gaining a lot of attention. In this paper, we examine the performance of several supervised classifiers in the process of identifying hate speech on Twitter. More precisely, we do an empirical study that analyzes the influence of two types of linguistic features (n-grams, word embeddings) when they are used to feed different supervised machine learning classifiers: Support Vector Machine (SVM), Gaussian Naive Bayes (GNB), Complement Naive Bayes (CNB), Decision Tree (DT), Nearest Neighbors (KN), Random Forest (RF) and Neural Network (NN). The experiments we have carried out show that CNB, SVM, and RF are better than the rest classifiers in English and Spanish languages by taking into account all features.Xunta de Galicia | Ref. ED431C 2018/50Agencia Estatal de Investigación | Ref. TIN2017-85160-C2-2-

Investigo

Modeling of learning curves with applications to POS tagging

Author: Darriba Bilbao Víctor Manuel
Ribadas Pena Francisco José
Vilares Ferro Manuel
Publication venue: COmputational LEarnig
Publication date: 07/11/2023
Field of study

An algorithm to estimate the evolution of learning curves on the whole of a training data base, based on the results obtained from a portion and using a functional strategy, is introduced. We approximate iteratively the sought value at the desired time, independently of the learning technique used and once a point in the process, called prediction level, has been passed. The proposal proves to be formally correct with respect to our working hypotheses and includes a reliable proximity condition. This allows the user to fix a convergence threshold with respect to the accuracy finally achievable, which extends the concept of stopping criterion and seems to be effective even in the presence of distorting observations. Our aim is to evaluate the training effort, supporting decision making in order to reduce the need for both human and computational resources during the learning process. The proposal is of interest in at least three operational procedures. The first is the anticipation of accuracy gain, with the purpose of measuring how much work is needed to achieve a certain degree of performance. The second relates the comparison of efficiency between systems at training time, with the objective of completing this task only for the one that best suits our requirements. The prediction of accuracy is also a valuable item of information for customizing systems, since we can estimate in advance the impact of settings on both the performance and the development costs. Using the generation of part-of-speech taggers as an example application, the experimental results are consistent with our expectations.Ministerio de Economía y Competitividad | Ref. FFI2014-51978-C2-1-

Investigo

Ampliar y descubrir contenidos en Inteligencia Artificial mediante el uso de agregadores de enlaces, votaciones y karma

Author: Darriba Bilbao Víctor Manuel
Fernández Santiago
Ribadas Pena Francisco José
Publication venue: Universidade de Santiago de Compostela. Escola Técnica Superior de Enxeñaría
Publication date: 01/01/2010
Field of study

El tener que acotar y delimitar la serie de contenidos que abordar en un curso es una dificultad a la que debemos enfrentarnos a la hora de planificar la docencia de una materia. Esto es especialmente problemático en materias ya de por sí extensas como las relacionadas con la Inteligencia Artificial y supone tener que omitir partes importantes, tanto teóricas como aplicadas, de un campo en constante evolución. En este trabajo presentamos un intento de mitigar estos problemas haciendo uso de agregadores sociales de enlaces, como digg, reddit o meneane, que permiten que los alumnos exploren por sí mismos, descubran y compartan sus impresiones respecto a aspectos de la materia Inteligencia Artificial que en las clases presenciales no se pueden tratar en profundidad. En nuestro caso hemos implantado nuestro propio agregador de enlaces proponiendo una actividad complementaria cuya evaluación ha sacado provecho de los mecanismos de reputación, o karma, en los que este tipo de herramientas sociales basan su funcionamiento

Repositorio Institucional de la Universidad de Alicante

Information retrieval and machine learning methods for academic expert finding

Author: Bolaños Néstor
de Campos Luis M.
Fernández Luna Juan Manuel
Huete Juan F.
Ribadas Pena Francisco José
Publication venue: COmputational LEarnig
Publication date: 01/01/2024
Field of study

In the context of academic expert finding, this paper investigates and compares the performance of information retrieval (IR) and machine learning (ML) methods, including deep learning, to approach the problem of identifying academic figures who are experts in different domains when a potential user requests their expertise. IR-based methods construct multifaceted textual profiles for each expert by clustering information from their scientific publications. Several methods fully tailored for this problem are presented in this paper. In contrast, ML-based methods treat expert finding as a classification task, training automatic text classifiers using publications authored by experts. By comparing these approaches, we contribute to a deeper understanding of academic-expert-finding techniques and their applicability in knowledge discovery. These methods are tested with two large datasets from the biomedical field: PMSC-UGR and CORD-19. The results show how IR techniques were, in general, more robust with both datasets and more suitable than the ML-based ones, with some exceptions showing good performance.Agencia Estatal de Investigación | Ref. PID2019-106758GB-C31Agencia Estatal de Investigación | Ref. PID2020-113230RB-C22FEDER/Junta de Andalucía | Ref. A-TIC-146-UGR2

Investigo

Directory of Open Access Journals

Repositorio Institucional Universidad de Granada

Reconocimiento de patrones en bosques compartidos

Author: Ribadas Pena Francisco José
Publication venue: Sociedad Española para el Procesamiento del Lenguaje Natural
Publication date: 01/01/2002
Field of study

Tesis doctoral en Informática realizada por Francisco J. Ribadas Pena bajo la dirección del doctor Manuel Vilares Ferro (Universidade de Vigo). El acto de defensa de la tesis tuvo lugar el 29 de noviembre de 2002 ante el tribunal formado por los doctores José Luis Freire Nistal (Universidade da Coruña), Alejandro Sobrino Cerdeiriña (Universidade de Santiago de Compostela), Antonio Bahamonde Rionda (Universidad de Oviedo), Richard F.E. Sutcliffe (University of Limerick, Irlanda) y Jean-Cêdric Chappelier (Swiss Federal Institute of Technology, Suiza). La calificación obtenida fue Sobresaliente Cum Laude por unanimidad. Se puede obtener más información de la tesis en http://coleweb.dc.fi.udc.es.PhD Thesis in Computer Science written by Francisco J. Ribadas Pena under the supervision of Dr. Manuel Vilares (Universidade de Vigo, Spain). The author was examined in November 29, 2002 by the commitee formed by Dr. José Luis Freire Nistal (Universidade da Coruña, Spain), Dr. Alejandro Sobrino Cerdeiriña (Universidade de Santiago de Compostela, Spain), Dr. Antonio Bahamonde Rionda (Universidad de Oviedo, Spain), Dr. Richard F.E. Sutcliffe (University of Limerick, Ireland) and Dr. Jean-Cêdric Chappelier (Swiss Federal Institute of Technology, Switzerland). The grade obtained was Sobresaliente Cum Laude. Further information is available at http://coleweb.dc.fi.udc.es

Repositorio Institucional de la Universidad de Alicante

Repositorio da Universidade da Coruña

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Experiencias del grupo COLE en la aplicación de técnicas de Procesamiento del Lenguaje Natural a la Recuperación de Información en español

Author: Alonso Pardo Miguel
Ribadas Pena Francisco José
Vilares Ferro Jesús
Publication venue: Asociación Española para la Inteligencia Artificial (AEPIA)
Publication date: 01/01/2004
Field of study

Secretaría de Estado de Cultura

Optimizaciones en el reconocimiento de patrones

Author: Darriba Bilbao Víctor
Ribadas Pena Francisco José
Vilares Ferro Manuel
Publication venue: Sociedad Española para el Procesamiento del Lenguaje Natural
Publication date: 01/01/2000
Field of study

El objetivo del trabajo es reducir los costes de evaluación de interrogaciones en sistemas de recuperación de información que integren reconocimiento de patrones. En este contexto estudiamos la aplicación de estrategias de programación dinámica en situaciones de compartición de estructuras entre patrones. Nuestra intención es mejorar el rendimiento computacional en esta clase de estrategias, a menudo valoradas por la calidad de los resultados, pero desechadas por su complejidad en favor de enfoques menos sofisticados basados en la simple indexación de términos. El trabajo incluye los primeros resultados experimentales que, aunque preliminares, sugieren su viabilidad

Secretaría de Estado de Cultura

Optimización en el reconocimiento de patrones

Author: Darriba Bilbao Víctor Manuel
Ribadas Pena Francisco José
Vilares Ferro Manuel
Publication venue: Sociedad Española para el Procesamiento del Lenguaje Natural
Publication date: 01/01/2000
Field of study

Repositorio Institucional de la Universidad de Alicante

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Diseño de un entorno visualizado para la docencia práctica de Seguridad en Sistemas de Información

Author: Barcala Rodríguez Francisco Mario
Darriba Bilbao Víctor Manuel
Otero Pombo Juan
Ribadas Pena Francisco José
Publication venue: Librotex
Publication date: 01/01/2008
Field of study

La posibilidad de que los alumnos de materias relacionadas con la seguridad informática puedan realizar sin restricciones prácticas sobre sistemas y redes reales tiene un valor pedagógico indudable, ya que les permite enfrentarse a situaciones reales y resolver problemas que en las clases teóricas apenas se llegan siquiera a describir. Sin embargo, estas actividades conllevan una serie de dificultades técnicas y de disponibilidad de recursos, junto con otras derivadas de la propia disposición del alumno a la hora de enfrentarse a ellas. En este trabajo describimos un entorno de prácticas basado en el uso de equipos y redes virtualizadas y en el empleo de herramientas de seguridad de código abierto, que supera parte de los problemas inherentes a la realización de ejercicios sobre sistemas reales. Presentamos también el diseño y desarrollo de una serie de actividades de laboratorio que hacen uso del entorno descrito y que pretenden promover el trabajo autónomo en la resolución de problemas relacionados con la seguridad y la protección de sistemas

Repositorio Institucional de la Universidad de Alicante